Análisis de similitud basado en grafos: Una nueva aproximación a la detección de plagio translingüe

نویسندگان

  • Marc Franco-Salvador
  • Parth Gupta
  • Paolo Rosso
چکیده

Cross-language variant of automatic plagiarism detection tries to detect plagiarism among documents across language pairs. In recent years a few approaches are proposed that use thesauri, alignment models or statistical dictionaries to deal with the similarity across languages. We propose a new approach to the crosslanguage plagiarism detection that makes use of a multilingual semantic network to generate knowledge graphs, obtaining a context model for each document which the other methods lack. To evaluate the proposed method, we use the Spanish-English and German-English partitions of the PAN-PC’11 corpus and compare our results with two state-of-the-art approaches. Experimental results indicate its potential to be a new alternative for similarity analysis in cross-language plagiarism detection.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Generación Automática de Casos de Uso para Desarrollo de Software Basado en Reutilización

Resumen. El desarrollo de software con reutilización se basa en la selección adecuada de elementos reutilizables del repositorio. La generación automática de casos de uso es una opción para acelerar la definición precisa de los requisitos funcionales como paso inicial para el desarrollo de software con reutilización. Por lo anterior, en este artículo proponemos un marco de trabajo para normaliz...

متن کامل

Comparación de Representaciones Interválicas Hansonianas para Recuperación de Información Musical

La similitud melódica es un concepto importante a considerar en la recuperación de información musical. Algunas de las posibles aplicaciones son sistemas basados en contenido desarrollados para administración de derechos de autor, detección de plagio de ideas ya expuestas por un artista en el pasado, la asistencia a la composición, etc. Existen varias técnicas expuestas en similitud melódica qu...

متن کامل

Herramienta de apoyo en la detección de reutilización de código fuente

Resumen. El acto de tomar parcial o totalmente contenidos generados por otras personas, y presentarlos como propios, sin dar el crédito correspondiente a los autores, es una forma indebida de reutilización de contenidos, considerada como plagio. Desafortunamente, en la actualidad, dada la amplia disponibilidad de contenidos a través de Internet, esta práctica se ha incrementado. La gran mayoŕıa...

متن کامل

Una aproximación para resolución de ambigüedad estructural empleando tres mecanismos diferentes

Resumen La ambigüedad estructural es uno de los problemas más difíciles de resolver en sistemas de procesamiento de lenguaje natural. Consideramos dos tipos de resolución de ambigüedad estructural que pueden emplearse en el análisis de textos sin restricciones: conocimiento léxico y cierta clase de contexto. En este trabajo, proponemos un modelo basado en tres diferentes mecanismos para revelar...

متن کامل

Verificación y Validación en el Ámbito del Desarrollo Basado en Modelos de Interfaces de Usuario

Resumen. En este trabajo, se presenta un enfoque para la verificación del diseño de interfaces de usuario. Nuestra aproximación se centra en el desarrollo basado en modelos propuesto por UsiXML, que considera cuatro niveles de abstracción: definición de tareas y conceptos, interfaz abstracta, concreta y final. Hemos añadido un proceso de validación y verificación basado en redes de Petri a esta...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 50  شماره 

صفحات  -

تاریخ انتشار 2013